© h.hofstede (h.hofstede@hogeland.nl)

Doe de normaal-test!
     

We weten nu dat de normale verdeling ongeveer zo'n klokvorm geeft, maar er zijn zovéél histogrammen die ongeveer zo'n vorm hebben. Hoe kun je nou onderzoeken of ze wel precies aan die moeilijke formule van Gauss voldoen?
Neem de volgende drie histogrammen:
     

       
Welk van de drie geeft een echte klokvorm?
Het zijn allemaal  wel ongeveer klokvormen. De vraag is eigenlijk of de kromming van de  klokvorm past bij een normale verdeling.

Er is gelukkig een eenvoudige methode om dat te onderzoeken. Daarvoor moet je wel weten wat een cumulatief frequentiepolygoon is. Als je dat bent vergeten neem dan eerst deze les weer door. Onthoud de volgende zaken:
       
1.  De frequenties moeten in procenten.
2.  De stippen staan bij het rechter-klasseneinde.
       
Er is papier dat zó gemaakt is dat cumulatieve normale verdelingen op dat papier rechte lijnen opleveren. Dat papier heet heel toepasselijk normaal-waarschijnlijkheids-papier (meestal zeg je gewoon normaal-papier) HIER kun je een velletje bewonderen. Let op de vreemde verdeling van de y-as: Vanaf het midden naar boven en naar beneden toe is de schaal steeds verder "uitgerekt".
Laten we de drie histogrammen van het begin van deze les meteen gaan testen.
Maak de gegevens cumulatief en in procenten. Dat geeft de volgende drie tabellen:
       
rechter
klasseneinde
cumulatieve
frequentie
6
7
8
9
10
11
12
7
16
31
50
69
84
93
rechter
klasseneinde
cumulatieve
frequentie
6
7
8
9
10
11
12
2
12
30
50
70
88
98
rechter
klasseneinde
cumulatieve
frequentie
6
7
8
9
10
11
12
2
5
15
50
85
95
98
       
En dat geeft op normaalpapier de volgende drie grafieken:
       

       
Zo te zien hoort het eerste histogram bij een "echte"  klokvorm. Dat geeft namelijk op normaalpapier het mooist een rechte lijn. In de andere twee zit een soort van kromming.

Er valt nog iets op......

De klasse >12 konden we niet tekenen omdat immers de rechtergrens onbekend is. Maar dat geeft niet. Ook al was die grens wél bekend, dan konden we het punt nóg niet tekenen. Dat komt omdat 100% niet op de y-as van ons normaalpapier te vinden is! Hetzelfde geldt voor 0%.
       

100% en 0% zijn op normaalpapier niet te vinden.

       
Gemiddelde en Standaarddeviatie.
       
Als je zo'n histogram eenmaal op normaalpapier hebt getekend kun je uit die grafiek het gemiddelde en de standaarddeviatie vrij eenvoudig aflezen.
Het gemiddelde dat kun je zelf wel verzinnen hoop ik; dat zit uiteraard bij 50% want omdat de klokvorm symmetrisch is, is het gemiddelde gelijk aan de mediaan en dus zit 50% van de metingen daar onder.
De standaarddeviatie kun je vinden als je de figuur hiernaast weer even voor ogen haalt. Tussen μ + σ en  μ - σ zat 68% van de meetwaarden. Dat betekent dat onder m - σ  nog 16% zit, en boven  m + σ ook.
Kortom:  μ - σ kun je vinden bij 16% en  μ + σ bij 100 - 16 = 84%.
σ  is dan uiteraard de horizontale afstand tussen μ en μ + σ .
Dat zie je samengevat in de figuur hiernaast.

Uit die figuur blijkt ook meteen dat σ  in feite de helling van de lijn bepaalt: hoe groter σ, des te kleiner de helling. Twee normale verdeling met dezelfde standaarddeviatie zullen op normaalpapier evenwijdige grafieken opleveren. Dat kun je handig gebruiken bij opgaven als deze:

 

Voorbeeld:
Van een normaal verdeelde grootheid is 10% kleiner dan 40 en de standaarddeviatie is 12. Bepaal met normaalpapier hoeveel procent groter is dan 60.

Oplossing:
Teken op normaalpapier een lijn met een willekeurig gemiddelde en met standaarddeviatie 12.
Bijvoorbeeld een lijn door (40, 50%) en (52, 84%).
Teken vervolgens door het punt (40, 10%) een tweede lijn evenwijdig aan de eerste. Deze tweede lijn heeft dan ook standaarddeviatie 12. Lees op deze lijn bij 60 af hoeveel procent kleiner dan 60 is. Dan weet je ook hoeveel procent groter dan 60 is. (Doe het zelf maar, er komt ongeveer 65% uit).
       
 
                                       
  OPGAVEN.
       
 HIER kun je een velletje normaal-waarschijnlijkheidspapier vinden
       
1. Onderzoek of de volgende tabellen een normale verdeling beschrijven.
       
 
meting <35 35-42 42-49 49-56 56-63 63-70 >70
frequentie 9 128 514 611 215 22 1
       
 
meting 0-8 8-16 16-24 24-32 32-40 40-48 48-56 56-64 64-72
frequentie 6 9 45 540 1200 600 300 180 120
       
2. De volgende tabel beschrijft een normale verdeling.
       
 
meting 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100
frequentie (%) 2,2 4,9 10,1 16,5 20,5 19,5 14,0 7,7 4,6
       
  Bereken van deze verdeling het gemiddelde en de standaardafwijking. Doe dat op twee manieren:
       
  a. Met de functie STAT-CALC van je rekenmachine.
       
  b. Met normaal-waarschijnlijkheidspapier.
       
3. Het gewicht van de eieren die de kippen op een kippenfarm leggen is normaal verdeeld.
8% van de eieren is lichter dan 58 gram en 21% is zwaarder dan 69 gram.
Bepaal het gemiddelde en de standaardafwijking van deze eieren.
       
4. De vleugelspanwijdte van de volwassen zeearend is normaal verdeeld met een standaardafwijking van 150 cm.
9% van de vogels blijkt een spanwijdte van meer dan 250 cm te hebben.
Hoeveel procent zal dan een spanwijdte van minder dan 200 cm hebben?
Onderzoek dat met behulp van normaal-waarschijnlijkheidspapier.
       
 

© h.hofstede (h.hofstede@hogeland.nl)